년 4분기 AI 및 로봇 연구 동향

년 4분기 AI 및 로봇 연구 동향

1. 서론: 2008년, AI와 로보틱스 연구의 변곡점

2008년 4분기는 인공지능(AI) 및 로봇 연구 역사에서 중요한 변곡점으로 기록된다. 이 시기는 통계적 기계학습 방법론이 성숙기에 접어들면서 그 한계가 논의되기 시작했고, 동시에 이후 10년간 AI 분야를 지배하게 될 딥러닝 패러다임의 사상적, 기술적 기반이 다져지던 결정적인 순간이었다. 특히 얕은 모델(shallow models)의 표현력 한계를 극복하고 데이터에 내재된 복잡한 계층적 구조를 학습하려는 시도가 학계의 주류 담론으로 부상했다.1

본 보고서는 2008년 4분기에 개최된 세계 최고 수준의 학술대회들을 중심으로 당시의 핵심 연구 성과를 심층 분석한다. 분석 대상이 되는 주요 학술의 장은 기계학습 분야의 신경정보처리시스템학회(NIPS 2008), 컴퓨터 비전 분야의 유럽컴퓨터비전학회(ECCV 2008), 그리고 로보틱스 분야의 지능형로봇및시스템학회(IROS 2008)이다. 이들 학회는 각 분야의 가장 혁신적인 아이디어와 기술이 발표되는 최고 권위의 포럼으로, 당시 연구 동향을 파악하는 데 가장 정확한 지표를 제공한다.3

보고서는 총 3부로 구성된다. 제1부에서는 NIPS 2008과 주요 저널(JMLR)을 중심으로 기계학습의 근본적인 진보를 다룬다. 특히 고차원 데이터 시각화의 혁신을 가져온 t-SNE와 딥러닝의 서막을 연 계층적 모델 연구를 집중적으로 조명한다. 제2부에서는 ECCV 2008과 PAMI를 중심으로 객체 탐지 패러다임을 바꾼 변형 가능 파트 모델(DPM)과 총체적 장면 이해를 향한 시도 등 시각 지능의 도약을 분석한다. 마지막으로 제3부에서는 IROS 2008과 IJRR의 성과를 바탕으로 안전한 인간-로봇 상호작용, 생체모방 로보틱스, 자율 주행 기술 등 지능형 로봇 시스템의 발전을 고찰한다. 이를 통해 2008년 4분기가 미래 AI 기술의 방향성을 제시한 중요한 시기였음을 입증하고자 한다.

학회명개최 기간 및 장소핵심 분야주요 주제
NIPS 20082008년 12월 8-11일, 캐나다 휘슬러기계학습계층적 모델, 베이즈 추론, 인간 학습과의 연계, 비지도/준지도 학습 1
ECCV 20082008년 10월 12-18일, 프랑스 마르세유컴퓨터 비전객체 인식 및 탐지, 3D 재구성, 사람 및 얼굴 인식, 분할, 매칭 4
IROS 20082008년 9월 22-26일, 프랑스 니스로보틱스인간-로봇 상호작용, 자율주행차, 휴머노이드, 생체모방 로봇, 수술 로봇 5

2. 기계 학습의 지평 확장: NIPS 2008 및 JMLR 주요 연구

2008년 4분기 기계학습 분야는 데이터의 본질적 구조를 더 깊이 이해하고 표현하려는 노력과, 기존 모델의 한계를 극복하기 위한 새로운 알고리즘적 돌파구가 동시에 나타난 시기였다. 특히 고차원 데이터의 시각화, 심층 아키텍처에 대한 초기 탐구, 그리고 확률론적 모델링의 정교화는 이 시기의 연구를 대표하는 핵심 주제였다.

2.1 고차원 데이터 시각화의 혁신: t-SNE

고차원 데이터를 인간이 직관적으로 이해할 수 있는 2차원 또는 3차원 공간에 표현하는 것은 데이터 분석의 오랜 난제였다. 기존의 Sammon mapping, Isomap, Locally Linear Embedding (LLE)과 같은 기법들은 데이터가 복잡한 비선형 매니폴드(manifold) 위에 분포하거나 여러 클러스터로 나뉘어 있을 때, 데이터의 국소적(local) 구조와 전역적(global) 구조를 동시에 보존하는 데 한계를 보였다.9

이러한 배경 속에서 2008년 Journal of Machine Learning Research (JMLR)에 발표된 Laurens van der Maaten과 Geoffrey Hinton의 “Visualizing Data using t-SNE“는 데이터 시각화 분야에 혁신을 가져왔다.10 t-SNE의 핵심은 기존의 Stochastic Neighbor Embedding (SNE)을 계승하고 발전시키는 데 있다. SNE는 고차원 공간상의 데이터 포인트 간 유클리드 거리를 확률적 유사도로 변환한다. 구체적으로, 데이터 포인트 x_i가 이웃으로 x_j를 선택할 조건부 확률 p_{j \vert i}를 가우시안 분포를 중심으로 모델링한다.9
p_{j \vert i} = \frac{\exp(-\Vert x_i - x_j \Vert^2 / 2\sigma_i^2)}{\sum_{k \neq i} \exp(-\Vert x_i - x_k \Vert^2 / 2\sigma_i^2)}
t-SNE는 두 가지 중요한 개선을 통해 SNE의 한계를 극복했다. 첫째, 최적화의 편의성과 이론적 명료성을 위해 조건부 확률 p_{j \vert i}를 결합 확률 p_{ij}로 변환하는 대칭적 SNE(Symmetric SNE)를 도입했다. 둘째이자 가장 핵심적인 혁신은, 저차원 공간에서의 유사도 q_{ij}를 모델링할 때 기존의 가우시안 분포 대신 자유도가 1인 스튜던트 t-분포(Student’s t-distribution)를 사용한 것이다.
q_{ij} = \frac{(1 + \Vert y_i - y_j \Vert^2)^{-1}}{\sum_{k \neq l} (1 + \Vert y_k - y_l \Vert^2)^{-1}}
t-분포는 가우시안 분포보다 두꺼운 꼬리(heavy tails)를 가지기 때문에, 고차원 공간에서 멀리 떨어져 있던 데이터 포인트들을 저차원 공간에서 더욱 강하게 밀어내는 효과를 발생시킨다. 이 특성 덕분에 SNE의 고질적인 문제였던 ‘밀집 문제(crowding problem)’, 즉 서로 다른 클러스터의 데이터들이 맵 중앙에 빽빽하게 모여드는 현상을 효과적으로 해결할 수 있었다.9 t-SNE는 고차원 확률 분포 P와 저차원 확률 분포 Q 사이의 Kullback-Leibler 발산(divergence)을 최소화하는 것을 목표로 하며, 이는 다음의 비용 함수로 표현된다.12
C = KL(P \Vert Q) = \sum_{i} \sum_{j} p_{ij} \log \frac{p_{ij}}{q_{ij}}
t-SNE는 기존 기법들보다 월등한 시각화 결과를 제공함으로써, 복잡한 데이터의 내부 구조를 탐색하고 이해하는 데 결정적인 도구를 제공했다. 이 연구의 파급력은 매우 커서, 이후 머신러닝, 생물정보학, 데이터 과학 전반에 걸쳐 표준적인 비선형 차원 축소 및 시각화 기법으로 확고히 자리 잡게 되었다.

2.2 딥러닝의 서막: 계층적 모델과 비지도 학습

2012년 AlexNet의 등장으로 촉발된 딥러닝 혁명 이전인 2008년은, 이미 소수의 선구적인 연구 그룹들을 중심으로 심층 신경망(Deep Neural Networks)의 잠재력이 활발히 탐구되던 시기였다. NIPS 2008은 이러한 흐름을 명확히 보여주는 증거의 장이었다. 특히 “Machine Learning Meets Human Learning” 워크숍은 인간의 학습 방식에서 영감을 얻어 기계학습 알고리즘을 개선하려는 시도들이 집결된 곳으로, 심층 아키텍처에 대한 논의가 핵심을 이루었다.1

이 워크숍에서 Yoshua Bengio는 “Learning Algorithms for Deep Architectures“라는 제목의 발표를 통해, 여러 층으로 구성된 심층 구조를 효과적으로 학습시키기 위한 알고리즘 연구가 활발히 진행 중임을 시사했다.1 이는 얕은 모델로는 학습하기 어려운 복잡하고 추상적인 표현을 데이터로부터 학습하려는 시도가 이미 구체화되고 있었음을 보여준다.

같은 맥락에서 Andrew Ng 연구 그룹은 “Translation-invariant sparse deep belief networks for scalable unsupervised learning of hierarchical representation“이라는 포스터를 발표했다.1 이 연구는 심층 신뢰 신경망(Deep Belief Networks, DBN)을 이용하여 레이블이 없는 이미지 데이터로부터 변환에 불변하는(translation-invariant) 계층적 특징을 학습하는 방법을 탐구했다. 이는 이후 컨볼루션 신경망(CNN)의 발전에 중요한 이론적, 실용적 영감을 제공한 선구적인 연구였다.

또한, Geoffrey Hinton 그룹의 Andriy Mnih는 “A Scalable Hierarchical Distributed Language Model“을 발표하여 언어 모델링 분야에서도 계층적 구조의 중요성을 역설했다.2 이 연구는 대규모 텍스트 데이터로부터 단어의 의미론적 표현을 계층적으로 학습함으로써 모델의 표현력과 확장성을 동시에 확보하려는 시도였다. 이는 현대적인 대규모 언어 모델(LLM)의 초기 형태로 평가될 수 있다.

이들 연구는 공통적으로 ’계층성(hierarchy)’과 ’비지도 학습(unsupervised learning)’을 핵심 키워드로 삼고 있었다. 이는 레이블이 부족한 대규모 데이터로부터 유의미한 표현(representation)을 학습하는 것이 딥러닝의 핵심 과제임을 당시 연구자들이 이미 깊이 인지하고 있었음을 명확히 보여준다. 2008년 NIPS는 딥러닝이라는 거대한 파도가 밀려오기 직전, 그 파도를 일으킬 핵심 아이디어들이 공유되고 논의되던 중요한 역사적 현장이었다.

2.3 확률론적 모델링 및 추론의 정교화

심층 아키텍처에 대한 탐구와 더불어, 데이터를 설명하는 정교한 확률 모델을 구축하고 그로부터 효율적인 추론을 수행하려는 연구 역시 활발히 진행되었다. 이는 데이터 기반의 표현 학습과 모델 기반의 지식 통합이라는 두 가지 연구 흐름이 상호 보완적으로 발전하고 있었음을 보여준다.

대표적으로 Calderhead 등의 “Accelerating Bayesian Inference over Nonlinear Differential Equations with Gaussian Processes” 연구는 물리학, 생물학 등에서 시스템의 동역학을 설명하는 비선형 미분방정식에 베이즈 추론을 적용할 때 발생하는 계산적 어려움을 가우시안 프로세스(Gaussian Process, GP)를 이용해 해결하는 방법을 제시했다.13 이는 복잡한 과학적 모델링에 기계학습을 효과적으로 접목할 수 있는 길을 열어준 중요한 연구였다.

빅데이터 시대를 맞이하여 모델의 확장성 문제 또한 주요 화두였다. Smyth 등의 “Asynchronous Distributed Learning of Topic Models“는 대규모 문서 집합에 대한 토픽 모델링을 병렬적으로 수행하는 비동기 분산 학습 알고리즘을 제안하여, 대용량 데이터 처리의 실질적인 해법을 제시했다.13

한편, 데이터로부터 모델의 복잡도를 자동으로 결정하려는 비모수 베이즈(Nonparametric Bayesian) 방법론도 큰 발전을 이루었다. “The Infinite Factorial Hidden Markov Model” 13이나 “Mixed Membership Stochastic Blockmodels” 13과 같은 연구들은 은닉 상태의 개수나 네트워크의 커뮤니티 개수 등을 데이터에 기반하여 자동으로 추론함으로써, 모델 선택의 어려움을 완화하고 데이터에 더 유연하게 적응하는 모델링의 가능성을 보여주었다.

3. 시각 지능의 도약: ECCV 2008 및 PAMI 주요 연구

2008년 컴퓨터 비전 분야는 이미지 속 객체를 단순히 인식하는 것을 넘어, 그 형태의 변화에 강인하게 대처하고 이미지 전체의 맥락을 총체적으로 이해하려는 방향으로 나아가고 있었다. ECCV 2008과 같은 해 PAMI 저널에 발표된 연구들은 이러한 흐름을 주도하며 시각 지능 기술의 새로운 지평을 열었다.

3.1 객체 탐지의 새로운 패러다임: 변형 가능 파트 모델 (DPM)

2000년대 중반까지 객체 탐지 분야는 Viola-Jones 프레임워크나 HOG(Histogram of Oriented Gradients) 특징 기반의 고정된 템플릿 방식이 주를 이루었다. 이러한 방식들은 특정 형태의 객체에는 효과적이었으나, 실제 세계의 객체들이 보이는 다양한 자세, 시점, 그리고 클래스 내 변이(intra-class variation)에 따른 형태 변화를 제대로 다루지 못하는 명백한 한계를 가지고 있었다.

이러한 문제의식 속에서 ECCV 2008에서 발표된 Felzenszwalb, McAllester, Ramanan의 “A Discriminatively Trained, Multiscale, Deformable Part Model“은 객체 탐지 분야의 패러다임을 전환시킨 기념비적인 연구였다.14 DPM은 객체의 ’변형’을 명시적으로 모델링함으로써 기존 방식의 한계를 정면으로 돌파했다. DPM의 핵심 아이디어는 객체를 하나의 강인한(rigid) 템플릿이 아닌, 저해상도의 ’루트 필터(root filter)’와 그에 연결된 고해상도의 여러 ’파트 필터(part filters)’의 조합으로 표현하는 것이다.16 각 파트 필터는 루트 필터에 대해 이상적인 상대 위치를 가지며, 이 위치에서 벗어날수록 스프링과 같은 ’변형 비용(deformation cost)’이 부과되는 공간 모델을 가진다.

DPM의 성공은 혁신적인 모델 구조뿐만 아니라, 이를 효과적으로 학습시키기 위해 새롭게 제안된 ‘잠재 변수 SVM (Latent SVM, LSVM)’ 프레임워크 덕분이었다. LSVM에서는 객체의 정확한 위치와 각 파트의 위치를 관찰되지 않는 ‘잠재 변수(latent variable)’ z로 취급한다. 분류기의 점수는 모든 가능한 잠재 변수 설정에 대한 점수 중 최댓값으로 정의된다.14
f_{\beta}(x) = \max_z \beta \cdot \Phi(x, z)
여기서 \beta는 모델 파라미터 벡터, \Phi(x, z)는 이미지 x와 잠재 변수 z에 의해 결정되는 특징 벡터이다. 이 최적화 문제는 비볼록(non-convex)이지만, 양성 예제(positive examples)에 대한 잠재 변수 z가 고정되면 볼록(convex) 문제가 되는 ‘반-볼록(semi-convex)’ 특성을 가진다. 연구진은 이 특성을 이용하여 모델 파라미터 \beta와 잠재 변수 z를 번갈아 최적화하는 효율적인 학습 알고리즘을 개발했다.

DPM은 PASCAL VOC 2006 및 2007 챌린지에서 당시 최고 성능을 압도적으로 경신하며 객체 탐지 분야의 새로운 표준을 제시했다.14 이 모델은 이후 딥러닝 기반 탐지기(예: R-CNN)가 등장하기 전까지 수년간 객체 탐지 연구의 지배적인 패러다임으로 군림했으며, 정교한 모델 구조와 강력한 학습 방법론의 결합이 얼마나 큰 성능 향상을 가져올 수 있는지 보여준 대표적인 사례로 남았다.

3.2 총체적 장면 이해를 향하여

ECCV 2008에서는 개별 객체 탐지를 넘어 이미지 전체의 의미론적, 구조적 관계를 이해하려는 ‘총체적 장면 이해(Holistic Scene Understanding)’ 연구가 중요한 흐름을 형성했다. 이는 컴퓨터 비전의 목표가 단순히 이미지 안에 ’무엇이 있는가(what)’를 넘어, 객체들이 ’어떻게 구성되어 있는가(how)’를 파악하는 방향으로 확장되고 있음을 보여준다.

NIPS 2008에서 발표된 Heitz 등의 “Cascaded Classification Models: Combining Models for Holistic Scene Understanding” 연구는 이러한 방향성을 잘 보여준다.13 이 연구는 장면 내 여러 객체들의 존재 여부와 상호 관계를 모델링하기 위해 다수의 분류기를 계층적으로 결합하는 모델을 제안했다. 예를 들어, ’컴퓨터’가 탐지되면 ’키보드’나 ’마우스’가 존재할 확률이 높아지는 맥락 정보를 모델에 통합하는 방식이다.

또한, PAMI 12월호에 게재된 “Structure Inference for Bayesian Multisensory Scene Understanding“은 베이즈 네트워크를 이용하여 다양한 센서 정보와 장면의 구조적 지식을 통합하려는 시도를 보여주었으며 18, “Combined Top-Down/Bottom-Up Segmentation“과 같은 연구는 상향식(bottom-up) 단서(에지, 질감)와 하향식(top-down) 지식(객체 모델)을 결합하여 보다 정교한 이미지 분할을 달성하고자 했다.18 이러한 연구들은 장면을 구성하는 요소들의 상호 의존성을 모델링함으로써 보다 강인하고 정확한 시각 인식을 구현하려는 노력이었다.

3.3 3차원 세계의 재구성 및 인간 중심 분석

2D 이미지로부터 3차원 정보를 복원하고, 이미지 속 인간을 정밀하게 분석하는 기술 또한 ECCV 2008의 주요 연구 주제였다. 단일 이미지로부터 도시 장면의 3D 모델을 추정하는 연구나 7, 여러 대의 카메라를 이용해 변형되는 표면을 실시간으로 추적하는 연구는 컴퓨터 비전 기술이 가상현실, 증강현실, 로보틱스 등 다양한 응용 분야로 확장될 수 있는 가능성을 보여주었다.7

특히 인간 중심 분석 기술의 발전이 두드러졌다. 옷을 입은 사람의 이미지로부터 3D 신체 형태를 추정하는 기술, 3D 동영상 데이터를 이용해 미묘한 얼굴 표정 변화를 인식하는 기술, 그리고 수백 명이 운집한 고밀도 군중 속에서 특정 개인을 추적하는 알고리즘 등이 발표되었다.7 이는 컴퓨터 비전의 응용 범위가 단순 감시를 넘어 인간과의 상호작용, 의료, 엔터테인먼트 등 인간의 삶과 밀접한 영역으로 깊숙이 파고들고 있음을 시사하는 중요한 성과들이었다.

4. 지능형 로봇 시스템의 진보: IROS 2008 및 IJRR 주요 연구

2008년 로보틱스 분야는 로봇이 통제된 공장 환경을 넘어 인간과 공간을 공유하고 물리적으로 상호작용하는 시대를 대비하는 기술적 토대를 마련하는 데 집중했다. IROS 2008의 컨퍼런스 테마인 “Robots for the planet“은 로봇 기술이 인간 삶의 모든 측면에 스며들고 있으며, 지속 가능한 발전을 위해 인간과 로봇의 공존을 관리해야 할 필요성을 강조한 것으로, 당시의 시대적 요구를 잘 반영한다.5

4.1 안전한 물리적 인간-로봇 상호작용 (pHRI)

로봇이 인간의 생활 공간으로 들어오면서, 예상치 못한 충돌이 발생했을 때 인간의 안전을 보장하는 기술은 로보틱스 분야의 가장 시급하고 중요한 과제로 부상했다. 이러한 배경에서 IROS 2008 최우수 응용 논문상(Best Application Paper Award)을 수상한 Haddadin 등의 “Collision detection and reaction: a contribution to safe physical human-robot interaction“은 물리적 인간-로봇 상호작용(pHRI) 연구에 있어 기념비적인 성과였다.19

이 연구의 핵심은 외부의 값비싼 센서(비전, 근접 센서 등)에 의존하지 않고, 로봇 내부에 장착된 관절 토크 센서와 정교한 동역학 모델만을 이용하여 외부와의 충돌을 신속하고 정확하게 탐지하는 것이다. 연구진은 로봇의 움직임을 예측하는 동역학 모델로부터 계산된 예상 토크 값과, 관절 토크 센서에서 실제로 측정된 값의 차이, 즉 잔차(residual)를 지속적으로 모니터링하는 관측기(observer)를 설계했다. 평상시 이 잔차는 모델 오차 범위 내에서 작게 유지되지만, 외부 물체와 충돌이 발생하면 예측하지 못한 외부 토크 \tau_{ext}가 가해져 잔차가 급격히 증가하게 된다. 이 변화를 감지하여 충돌을 판단하는 것이다. 이 방법론의 기반이 되는 로봇 동역학 방정식은 다음과 같다.20
M(q)\ddot{q} + C(q, \dot{q})\dot{q} + g(q) = \tau + \tau_{ext}
더 나아가, 이 연구는 충돌 탐지 이후의 ’반응 전략’이 안전에 있어 핵심적인 역할을 함을 보였다. 단순히 로봇을 급정지시키는 것(Strategy 1)을 넘어, 충돌 즉시 로봇 제어기를 위치 제어 모드에서 힘 제어 모드로 전환하여 외부 힘에 순응적으로 반응하게 만드는 ‘무중력 토크 제어’(Strategy 2)나, 충돌이 감지된 방향의 반대 방향으로 로봇을 움직이게 하는 ‘어드미턴스 제어’(Strategy 4) 등 다양한 반응 전략을 구현하고 그 효과를 정량적으로 비교 평가했다.20 실험 결과, 제안된 탐지 및 반응 전략은 최대 2.7 m/s의 속도로 움직이는 로봇 팔과의 충돌에서도 인체에 가해지는 충격력을 인체 상해 기준치보다 훨씬 낮은 수준으로 극적으로 감소시킬 수 있음을 입증했다.20 이 연구는 모델 기반 제어의 효용성을 명확히 보여주었으며, 이후 협동로봇(collaborative robot)의 안전 표준과 핵심 기술 개발에 지대한 영향을 미쳤다.

4.2 휴머노이드 및 생체모방 로보틱스

IROS 2008에서는 인간이나 동물의 구조와 작동 원리를 모방하여 로봇의 적응성과 효율성을 높이려는 연구가 활발하게 이루어졌다. IROS 워크숍에서는 로봇이 여러 상충하는 목표(예: 속도와 안정성) 사이에서 최적의 균형점을 찾는 다중 목표 최적화(multi-objective optimization)와 진화 알고리즘을 통해 복잡한 환경에 적응하는 능력을 점진적으로 학습하는 방법론이 심도 있게 논의되었다.22

특히 휴머노이드 로봇의 시각 능력 향상을 위한 연구가 주목받았다. 인간의 눈이 중심부(fovea)에서는 고해상도로, 주변부에서는 저해상도로 사물을 인식하는 구조를 모방한 ’중심와 시각 시스템(foveated vision system)’을 휴머노이드에 탑재한 연구가 발표되었다. 이 시스템을 통해 로봇은 넓은 시야로 주변 환경을 빠르게 탐색하면서도, 관심 영역은 고해상도로 정밀하게 분석하여 인간과 유사한 효율적인 시각 정보 처리를 수행할 수 있었다.22 또한, 곤충의 날갯짓을 모방한 소형 비행 로봇용 액추에이터나, 바퀴벌레의 움직임을 모방한 소형 보행 로봇(RoACH) 등 생물의 이동 방식을 공학적으로 구현하려는 다양한 시도들이 소개되었다.23

4.3 자율 이동 및 인식

로봇이 미지의 환경에서 스스로 위치를 파악하고(localization) 지도를 작성하며(mapping) 목표 지점까지 이동하는 SLAM(Simultaneous Localization and Mapping) 기술은 자율 로봇의 핵심 과제이다. 이 시기에는 특히 시각 센서를 이용한 SLAM 연구가 큰 진전을 이루었다.

International Journal of Robotics Research (IJRR)에 발표된 Cummins와 Newman의 “FAB-MAP” 연구는 카메라 이미지의 전체적인 외형(appearance)에 기반하여 이전에 방문했던 장소를 인식하는 확률적 접근법을 제시했다.24 이는 대규모 환경에서 SLAM을 수행할 때 누적되는 오차를 보정하는 ‘루프 폐쇄(loop closure)’ 문제를 효과적으로 해결하는 데 중요한 기여를 했다. 또한, 도심과 같이 GPS 신호가 불안정한 환경에서 강인한 위치 인식을 위해 GPS와 레이저 스캐너 데이터를 효과적으로 융합하는 연구나 23, 로봇이 스스로 센서를 움직여 환경에 대한 정보를 최적으로 획득하는 ’능동 감지(active sensing)’에 대한 연구도 발표되어 자율 로봇의 인식 능력과 지능을 한 단계 끌어올렸다.23

5. 결론: 2008년 4분기 연구 동향 종합 및 미래 전망

2008년 4분기는 AI와 로봇 연구가 새로운 시대로 진입하기 위한 결정적인 발판을 마련한 시기였다. 이 시기의 연구들은 세 가지 핵심적인 동향으로 요약될 수 있다. 첫째, 데이터의 복잡한 내재적 구조를 학습하기 위한 ’계층적/심층적 표현 학습’이 미래의 핵심 과제로 부상했다. 둘째, 정교한 ’확률론적 모델’과 대규모 데이터에 적용 가능한 ’강인한 학습 알고리즘’이 결합하여 기계학습의 응용 범위를 과학 및 산업 전반으로 확장했다. 셋째, 로봇이 물리적 세계와 ’안전하고 지능적으로 상호작용’하는 기술이 구체적인 공학적 해결책으로 제시되기 시작했다.

이 시기에 제시된 선구적인 개념과 기술들은 이후 2010년대 AI 연구의 폭발적인 성장을 직접적으로 견인했다. JMLR에서 발표된 t-SNE는 복잡한 데이터의 구조를 시각적으로 탐색하는 데이터 과학 분야의 필수 도구가 되었다. ECCV에서 발표된 DPM의 ’파트 기반 모델’과 ‘잠재 변수를 이용한 학습’ 아이디어는 딥러닝 시대의 객체 탐지 및 인간 자세 추정 모델에 깊은 영감을 주며 그 명맥을 이었다. IROS에서 논의된 안전한 물리적 인간-로봇 상호작용 기술은 오늘날 스마트 팩토리와 서비스 로봇 분야를 이끄는 협동로봇 시장의 핵심 기술적 토대가 되었다.

무엇보다 NIPS에서 논의되었던 ’심층 아키텍처’와 ’비지도 계층적 특징 학습’은 불과 몇 년 후 세상을 바꿀 딥러닝 혁명의 직접적인 예고편이었다. 이처럼 2008년 4분기는 단순히 과거의 연구를 집대성하는 시기가 아니라, 미래 AI 기술의 청사진을 제시하고 그 초석을 다진, 명백한 변곡점이었다.

논문저자발표처핵심 기여핵심 방법론장기적 영향
Visualizing Data using t-SNEvan der Maaten & HintonJMLR고차원 데이터의 국소/전역 구조를 보존하는 획기적 시각화 기법 제안 10저차원 유사도에 t-분포를 사용하여 SNE의 ‘밀집 문제’ 해결 9데이터 과학 및 머신러닝 분야의 표준 비선형 차원 축소 및 시각화 도구로 정착
A Discriminatively Trained, Multiscale, Deformable Part ModelFelzenszwalb et al.ECCV 2008객체의 형태 변화를 명시적으로 모델링하여 객체 탐지 성능을 획기적으로 향상 14루트/파트 필터 기반 모델과 잠재 변수 SVM(Latent SVM) 학습 프레임워크 도입 14딥러닝 이전 시대 객체 탐지 분야의 표준(de facto standard) 패러다임으로 군림
Collision Detection and Reaction: A Contribution to Safe pHRIHaddadin et al.IROS 2008모델 기반 제어를 통해 안전한 물리적 인간-로봇 상호작용을 구현하는 실용적 방법론 제시 20로봇 동역학 모델과 관절 토크 센서를 이용한 충돌 탐지 및 다중 반응 전략 구현 20현대 협동로봇(collaborative robot)의 안전 기술 및 표준 개발에 핵심적인 이론적/실험적 기반 제공

6. 참고 자료

  1. NIPS 2008 Workshop on Machine Learning Meets Human Learning - Computer Sciences User Pages - University of Wisconsin–Madison, https://pages.cs.wisc.edu/~jerryzhu/nips08.html
  2. NeurIPS 2008 Accepted Paper List - Paper Copilot, https://papercopilot.com/paper-list/neurips-paper-list/neurips-2008-paper-list/
  3. Neural Information Processing Systems (NIPS) - SIGMOD, http://www.sigmod.org/publications/dblp/db/conf/nips/index.html
  4. Computer Vision - ECCV 2008: 10th European Conference on Computer Vision, Marseille, France, October 12-18, 2008. Proceedings, Part II by David Forsyth, Paperback | Barnes & Noble®, https://www.barnesandnoble.com/w/computer-vision-eccv-2008-david-forsyth/1103488337
  5. IROS 2008 (IEEE/RSJ 2008 International Conference on Intelligent Robots and Systems), https://ewh.ieee.org/soc/ras/conf/financiallycosponsored/IROS/2008/
  6. Neural Information Processing Systems (NIPS) 2008 - Microsoft Research, https://www.microsoft.com/en-us/research/event/nips-2008/
  7. Computer Vision – ECCV 2008: 10th European Conference on Computer Vision, Marseille, France, October 12-18, 2008, Proceedings, Part II | Request PDF - ResearchGate, https://www.researchgate.net/publication/321555367_Computer_Vision_-_ECCV_2008_10th_European_Conference_on_Computer_Vision_Marseille_France_October_12-18_2008_Proceedings_Part_II
  8. IROS 2008 (IEEE/RSJ 2008 International Conference on Intelligent Robots and Systems) - Inria, http://iros2008.inria.fr/cfp.php
  9. Visualizing Data using t-SNE - Department of Computer Science, University of Toronto, https://www.cs.toronto.edu/~hinton/absps/tsne.pdf
  10. Visualizing Data using t-SNE - Journal of Machine Learning Research, https://www.jmlr.org/papers/volume9/vandermaaten08a/vandermaaten08a.pdf
  11. Visualizing Data using t-SNE, https://www.jmlr.org/papers/v9/vandermaaten08a.html
  12. (PDF) Viualizing data using t-SNE - ResearchGate, https://www.researchgate.net/publication/228339739_Viualizing_data_using_t-SNE
  13. Advances in Neural Information Processing Systems 21 (NIPS 2008), https://proceedings.neurips.cc/paper/2008
  14. A Discriminatively Trained, Multiscale, Deformable Part Model, https://cs.brown.edu/people/pfelzens/papers/latent.pdf
  15. [PDF] A discriminatively trained, multiscale, deformable part model | Semantic Scholar, https://www.semanticscholar.org/paper/A-discriminatively-trained%2C-multiscale%2C-deformable-Felzenszwalb-McAllester/860a9d55d87663ca88e74b3ca357396cd51733d0
  16. A Discriminatively Trained, Multiscale, Deformable Part Model, https://vision.cs.utexas.edu/381V-spring2016/slides/teammco-paper.pdf
  17. Object Detection with Discriminatively Trained Part Based Models - Semantic Scholar, https://www.semanticscholar.org/paper/Object-Detection-with-Discriminatively-Trained-Part-Felzenszwalb-Girshick/e79272fe3d65197100eae8be9fec6469107969ae
  18. IEEE Transactions on Pattern Analysis and Machine Intelligence - Table of Contents, https://www.computer.org/csdl/journal/tp/2008/12
  19. Awards - IROS 2008 (IEEE/RSJ 2008 International Conference on Intelligent Robots and Systems), http://iros2008.inria.fr/awards.php
  20. Collision Detection & Reaction: A Contribution to Safe Physical …, https://elib.dlr.de/55653/1/haddadin_et_al_iros2008.pdf
  21. Evaluation of Collision Detection and Reaction for a Human-Friendly Robot on Biological Tissues, https://elib.dlr.de/55654/1/haddadin_et_al_iarp2008.pdf
  22. The IEEE/RSJ IROS – MOR 2008 WORKSHOP, http://www.eng.tau.ac.il/~moshaiov/WEB-IROS-MOR2008.html
  23. 2008 IEEE/RSJ International Conference on Intelligent Robots and Systems, September 22-26, 2008, Acropolis Convention Center, Nice, France - Researchr, https://researchr.org/publication/iros%3A2008
  24. Robotics Research The International Journal of - BibBase, https://bibbase.org/service/mendeley/bfbbf840-4c42-3914-a463-19024f50b30c/file/4d63b63b-2b62-5651-2f05-96ed2f1df88a/cummins2008.pdf.pdf